Zhao Lab
GROUP FOR SOFT MATTER AND BIOPHYSICS RESEARCH

软物质物理学简介

        自1991年软物质命名以来,软物质不仅大大拓展了物理学的研究对象,还对物理学基础研究尤其是与非平衡现象(如生命现象)密切相关的物理学提出了重大挑战。软物质泛指处于固体和理想流体之间的复杂的凝聚态物质,主要共同点是其基本单元之间的相互作用较弱,因而易受温度影响,熵效应显著,且易形成有序结构。因此具有显著热波动、多个压稳状态、介观尺度自组装结构、熵驱动的顺序无序相变、宏观的灵活性等特征。简单地说,这些体系都体现了“小刺激、大反应”和强非线性的特性。这些特性并非仅仅由纳观组织或原子或分子的水平结构决定,更多的是由介观多级自组装结构决定。由于软物质物理其巨大的实用性以及迷人的物理性质,软物质自19世纪中后期进入数学、物理等不同学科领域。近二十年来更是快速发展成为一个高度交叉的庞大的研究方向,在基础科学和实际应用方面都有重大意义。
      《软物质物理基础》是面向高等学校理工科学生开设的一门初识软物质物理的重要的专业选修课程。该课程所教授的基本概念、基本理论和基本方法是构成软物质物理的重要组成部分,是未来从事软物质物理工作者所不可或缺的。对于物理专业的学生而言,学习《软物质物理基础》是对所学物理学专业知识的拓展与延伸,使他们懂得物理知识和方法在现代生物学、医学等学科中的应用,提高对学科交叉融合的认知。《软物质物理基础》为软物质物理感兴趣的学生系统地打好软物质物理的基础,培养学生树立科学的世界观,增强学生分析问题和解决问题的能力,在培养学生的探索精神和创新意识的同时,检验学生自身的科研能力与创新能力,为之后进一步学习软物质物理以及其他与软物质相关学科打下坚实的基础。
      《软物质物理基础》主要是对高年级开设的课程,针对学有余力且对软物质研究感兴趣学生开设的专业选修课。它的主要任务是:使学生了解软物质物理的基本理论和框架,掌握相关软物质物理分析工具的应用,深入了解本学科发展方向及国际学术研究前沿,并具有能运用所学的理论和方法以及相关学科知识解决软物质研究中实际问题的能力。

软物质物理选题

第1章 软物质物理基础知识
实验1 无规行走的可视化实现
无规行走最早由Pearson(1905)年提出,它是软物质物理中的重要模型。在单分子力学,蛋白质折叠,高分子结构等方面都能见到它的应用,研究证明,无规行走是大多数柔性高分子最典型的特征。
##要求:
利用Matlab或Python等编程软件实现无规行走动态可视化(二维或三维),并结合可视化结果介绍无规行走模型的基本原理。
实验2 软物质现象与原理
软物质在现实生活中十分常见,这些软物质中有许多特别的现象,例如将细管插入装满水的水杯里,细管里的水平面会上升;肥皂膜老化的过程中会产生黑膜;从这些常见的现象中发现的软物质物理的原理会为人们的生活提供便利,加速科技的发展。
##要求:
请介绍某种软物质或与软物质相关的现象,并解释背后所蕴含的软物质物理原理。所介绍的内容不得是课内讲授内容。
第2章 软物质生物分子基础
实验1 PDB、NDB数据库及PYMOL的使用
PDB蛋白质结构数据库(Protein Data Bank,简称PDB)是美国Brookhaven国家实验室于1971年创建的。PDB是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。NDB包含有关实验测定的核酸和复合物的结构信息。PYMOL适用于创作高品质的小分子或是生物大分子(特别是蛋白质)的三维结构图像。软件的作者宣称,在所有正式发表的科学文献中的蛋白质结构图像中,有四分之一是使用PyMOL来制作。
##要求:
请使用PDB或NDB下载一个蛋白质(核酸)的PDB文件,记录该结构的PDB ID,使用PYMOL可视化此文件,并鼠标操作实现:1.滚动、旋转结构;2.换用不同的显示样式,如卡通状、棍状等;3.随意更改几个氨基酸(核苷酸)的颜色,显示它们的氨基酸(核苷酸)名字。
PDB数据库的链接https://www.rcsb.org/
NDB数据库的链接http://ndbserver.rutgers.edu/
PYMOL的下载链接https://pymol.org/2/
实验2 复合物相互作用界面的计算
蛋白质与RNA或其他蛋白相互作用形成蛋白质复合物,以发挥生物学功能。若一个大分子(蛋白质或核酸)中的一个残基(氨基酸或核苷酸)中至少一个原子与另一个大分子中的一个残基(氨基酸或核苷酸)中的原子之间的距离小于4Å,则这两个残基被称为两个大分子的相互作用位点,所有这样的位点构成这两个大分子的相互作用界面。
##要求:
请在PDB数据库中下载PDB ID为1B23的蛋白质-RNA复合物,编写程序计算得到蛋白质复合物相互作用界面的氨基酸与核苷酸。辅助程序如下:
下载
第3章 软物质物理复杂网络模型
实验1 动力学网络分析
生命体由大量的蛋白质、核酸等生物大分子以及小分子组成,这些生物分子以及之间的相互作用和化学反映通路构成了复杂的生物网络系统。网络分析方法可以描述生物分子的结构特征,解释生物分子之间的相互作用和生物学调控机理等问题。随着生物实验技术的不断发展,生物大数据在急剧增加。网络科学在转录调控、转录后调控、蛋白质相互作用、信号传导通路、代谢通路等生物复杂系统中发挥着越来越重要的作用。复杂网络研究正成为研究人员广泛关注的热点,网络分析方法也逐渐成为描述生物系统的重要工具,在揭示生物分子功能和相关的疾病衰老等问题有重要的帮助与应用。 请尝试构建分子动力学网络,并做分析。
动力学网络分析手册为network_tutorial.pdf
动力学轨道文件为gluRStRNA.dcd,初始结构为gluRStRNA.psf,参数为network.config
下载
实验2 蛋白质/RNA相互作用预测
(蛋白质或RNA选做一个即可)
蛋白质和RNA内部的相互作用对其自身的结构稳定和功能至关重要。研究表明,氨基酸-氨基酸/碱基-碱基距离小于8Å的相互作用非常重要。现在知道蛋白质和RNA的多序列比对结果
蛋白质多序列比对为5PTI
RNA多序列比对为1Y26
请用互信息方法,通过分析多序列比对的序列共同进化关系,预测相互作用,并分析排名前30和前80的预测结果中,有多少距离小于8Å.
互信息方法的模型为 Appendix.pdf
下载
第4章 软物质物理前沿研究问题
实验1 蛋白质结构预测
激酶(kinase)蛋白是可以从高能供体分子(如ATP)转移磷酸基团到特定靶分子(底物)的酶,这一过程谓之磷酸化。CDK2是一种激酶蛋白,和细胞分裂,肿瘤细胞的形成有重要的关系。现在知道CDK2的序列如下:
>1FIN:A|PDBID|CHAIN|SEQUENCE
MENFQKVEKIGEGTYGVVYKARNKLTGEVVALKKIRLDTETEGVPSTAIREISLLKELNHPNIVKLLDVIHTENKLYLVFEFLHQDLKKFMDASALTGIPLPLIKSYLFQLLQGLAFCHSHRVLHRDLKPQNLLINTEGAIKLADFGLARAFGVPVRTYTHEVVTLWYRAPEILLGCKYYSTAVDIWSLGCIFAEMVTRRALFPGDSEIDQLFRIFRTLGTPDEVVWPGVTSMPDYKPSFPKWARQDFSKVVPPLDEDGRSLLSQMLHYDPNKRISAKAALAHPFFQDVTKPVPHLRL
请分别用SWISS-MODEL和I-TASSER预测CDK2的蛋白质结构,并比较结果的差异。
SWISS-MODEL
https://swissmodel.expasy.org
I-TASSER
https://zhanglab.ccmb.med.umich.edu/I-TASSER/
结构查看用PYMOL软件,CDK2的实验结构为1FIN
下载
实验2 RNA结构预测
核糖开关(Riboswitch)是2002年在细菌中作为一种基于RNA的胞内维生素衍传感器而被发现的。近十年的研究表明,核糖开关能与一系列小分子代谢物和铁离子结合并对转录、翻译、剪切、RNA稳定性实施调控作用,对开发抗生素、设计新型分子传感器等具有重要的指导意义。现知道核糖开关1Y26的序列如下:
>1Y26:X|PDBID|CHAIN|SEQUENCE
CGCUUCAUAUAAUCCUAAUGAUAUGGUUUGGGAGUUUCUACCAAGAGCCUUAAACUCUUGAUUAUGAAGUG
请分别用3dRNA和RNAComposer预测1Y26的RNA结构,并比较结果的差异。
3dRNA
http://biophy.hust.edu.cn/3dRNA RNAComposer http://rnacomposer.ibch.poznan.pl
结构查看用PYMOL软件,该核糖开关的实验结构为1Y26
下载
实验3 手写识别(0-9)
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习在手写识别上有很好的效果,请尝试分析手写识别0-9。
# 卷积神经网络(CNN)
## 问题描述:
利用卷积神经网络,实现对MNIST 数据集的分类问题。
## 数据集:
MNIST数据集包括60000张训练图片和10000张测试图片。图片样本的数量已经足够训练一个很复杂的模型(例如 CNN的深层神经网络)。它经常被用来作为一个新 的模式识别模型的测试用例。而且它也是一个方便学生和研究者们执行用例的数据集。除此之外,MNIST数据集是一个相对较小的数据集,可以在你的笔记本CPUs上面直接执行
## 题目要求:
tensorflow版的卷积神经网路 conv2d() 和max_pool_2x2()函数,然后补全两层卷积的 8个空;
pytorch版本的卷积神经网络 需要补齐 self.conv1 中 nn.Conv2d( ) 和 self.conv2( ) 的参数,还需要填写 x = x.view( )中的内容。
两个版本的训练精度都应该在 96% 以上。
下载
实验4 蛋白质分子对接(Protein-Protein/RNA/ligand)
(Protein-Protein,Protein-RNA,Protein-ligand选做一个即可)
分子对接是通过受体的特征以及受体和药物分子之间的相互作用方式来进行药物设计的方法。主要研究分子间(如配体和受体)相互作用,并预测其结合模式和亲合力的一种理论模拟方法。分子对接是计算机辅助药物研究领域的一项重要技术。
Protein-Protein的输入信息为:1fin_A.pdb,1fin_B.pdb。实验结果为1fin_AB.pdb
Protein-Ligand的输入信息为:1fin_A.pdb,1fin_C.pdb。实验结果为1fin_AC.pdb
Protein-RNA的输入信息为:1g59_A.pdb,1g59_B.pdb。实验结果为1g59_AB.pdb
请用一种对接方法,ZDock,Swissdock或HADDOCK,选择其中一个进行分子对接模拟,并比较和实验结果的差异。
下载